3D语义分割是驱动感知中最关键的任务之一。基于学习的模型准确感知密集的3D周围环境的能力通常可以确保自动驾驶汽车的安全操作。但是,基于激光雷达的3D语义分割数据库由依次获得的激光扫描组成,这些激光扫描是长尾且缺乏训练多样性的。在本报告中,我们引入了MixSeg3d,这是强度点云分割模型与先进的3D数据混合策略的复杂组合。具体来说,我们的方法将Minkunet家族与Lasermix和Polarmix集成在一起,这是两种场景 - 比例扩展方法,这些方法将LIDAR点沿Ego-Scene的倾斜度和方位角融合在一起。通过经验实验,我们证明了MixSeg3d在基线和先前的艺术中的优越性。我们的团队在2024 Waymo Open数据集挑战赛的3D语义Segmen track中获得了第二名。
主要关键词
![arxiv:2501.05472v1 [cs.cv] 2025年1月6日PDF文件第1页](/bimg/d/d602cad4f9f190e377fe12e4fd68968025d06aeb.webp)
![arxiv:2501.05472v1 [cs.cv] 2025年1月6日PDF文件第2页](/bimg/1/127a1933922ae96936cb9f8748624e5b280d5528.webp)
![arxiv:2501.05472v1 [cs.cv] 2025年1月6日PDF文件第3页](/bimg/5/56a4497ee12f9b01acb6835cd96893aae6c27718.webp)
![arxiv:2501.05472v1 [cs.cv] 2025年1月6日PDF文件第4页](/bimg/a/ab117ed0878f7db618d1b9792b809bf2bc09c5ce.webp)
![arxiv:2501.05472v1 [cs.cv] 2025年1月6日PDF文件第5页](/bimg/4/44bbb69f5b61f08e042e230000fbf5f5f9798038.webp)
